附下载丨《2023联邦学习全球研究与应用趋势报告》
近日,在澳门举行的第32届国际人工智能联合会议(IJCAI)上,由清华大学人工智能研究院知识工程研究中心(KEG)、北京智谱华章科技有限公司、开放群岛开源社区联合编写的《2023联邦学习全球研究与应用趋势报告》正式发布。
报告主要从技术研究、学者画像、主流框架、行业应用,以及发展趋势几大方面,较为全面深入地介绍联邦学习的技术研究和应用进展,并展望该技术的未来发展前景。
报告核心亮点
1、中美持续引领全球联邦学习发展
中美两国的论文发布量远远领先于其他国家,6成以上高被引论文,7成以上最佳论文都来自于中美两国。其中被高引论文数量最多的是谷歌和卡内基梅隆大学,中国则是北京邮电、香港科技、中山大学以及深圳市大数据研究院。
全球专利数量中国地区最多,约占全球七成。开源框架则主要来自中美。
2、未来研究趋势更多与算法模型、安全隐私技术相关
目前的研究热点主要聚焦在机器学习、模型训练和隐私保护方面,随着数据安全的监管越来越严,未来则更多涉及算法模型与安全隐私技术,如数据隐私、差分隐私、边缘计算、物联网、同态加密等。
行业应用越来越成熟,应用方向则呈现更多与物联网、区块链、客户端、电子设备等融合的态势。
目前,在系统和模型设计方面研究热点依照热度递减分别是聚合(aggregation)、优化 ( optimization )、异构( heterogeneity )、鲁棒性( robustness )、通信效率 (communication efficiency)、公平性(fairness)、激励机制(incentive mechanism) 和资源效率(resource efficiency)。
在安全隐私方面,联邦学习研究主题依据总热度递减依次包括区块链(blockchain)、 差分隐私(differential privacy)、安全多方计算(multiparty computation)、隐私泄露 (privacy leakage)、同态加密(homomorphic encryption)、恶意攻击(malicious attack)、网络安全(cyber security)以及容错(fault tolerance)。
3、联邦学习框架与系统分析
目前,市面上有许多来自于科研机构或企业的关于联邦学习的开源工程。报告通过AMiner 数据库中的新闻数据,按照开源与非开源两类,分析梳理了国内外主要的联邦学习相关系统框架。非开源的联邦学习框架基本上都是由企业推出的。
4、国家自然科学基金项目资助分析
根据基金组织官网上的公开数据,通过在项目标题中进行关键词67搜索,获取到了中国 (含大陆、港澳)以及中外地区合作的联邦学习基金项目资助情况。从目前所获取数据的总 体情况来看,虽然 2016 年至 2022 年间相关基金项目数量趋势略有上升,但是总量较少, 共计发现 156 个联邦学习在各地区的获批基金项目,包括 102 个国家自然科学基金项目 NSFC,26 个香港地区的创新及科技基金项目,澳门科学技术发展基金项目 FDCT 以及国家自然科学基金委员会国际合作项目分别各有 14 个。
5、联邦学习的应用现状
通过新闻事件分析挖掘和搜索系统 NewsMiner 数据库,从已公开的新闻数据发现,联邦学习技术的行业应用最早出现在 2018 年,当时被应用在金融、IT 和通信领域,后来几年其应用探索逐渐扩展到智慧城市、教育、汽车等其他多个行业领域。
金融领域,联邦学习在金融业应用目前处于框架设计、模型构建、合作探索、在几个业务场景中初步试点的阶段,应用主要体现在软硬件解决方案、数据安全、隐私保护、信贷营销、金融风险管理等方面。
医疗领域,联邦学习在医疗业应用目前处于研究探索、项目试点的阶段,参与主体不仅有科技公司,而且有较多的国内外权威科研机构、大学院所、医疗机构。
电信业,联邦学习的最初提出就是为了解决移动设备数据训练问题,可以看作是其在电信业的最早应用。从公开的新闻数据看,联邦学习在电信业应用探索从 2018 年开始至今,应用场景从早期的通信资源分配已扩展到近期的客户体验和精准营销、6G 和卫星网络等。其中的参与主体主要是大型通信运营商、软硬件制造商等。
6、联邦学习的技术发展趋势
本期的联邦学习技术研究热度前十主题仍然聚焦于安全与隐私技术方面,数据训练相关研究增幅较大,在应用方面更加突出了物联网与移动设备方面研究的同时,区块链再度入榜。
7、联邦学习的技术成熟度
基于 Gartner 近年发布的相关技术成熟度曲线,本报告发现,联邦学习于 2019 年首次出现在 Gartner 数据科学与机器学习技术成熟度曲线(Hype Cycle for Data Science andMachine Learning)之中,并且被视为“在分布环境下的训练机器学习算法的重要创新”。这表明联邦学习技术应用趋势发展较快,自诞生后仅用了三年时间就吸引了投资者、企业家和消费者的关注,也吸引到 Gartner 对该技术应用影响的研究。
此后两年,联邦学习相继出现在其他四个 Gartner 的技术成熟度曲线里面,分别是 2020与 2021 年发布的数据科学与机器学习技术成熟度曲线、以及 2021 年的隐私技术成熟度曲线(Hype Cycle for Privacy)与公用事业行业 IT 技术成熟度曲线(Hype Cycle for UtilityIndustry IT),详细情况如表 19 所示。
由表 19 可见,在这些技术成熟度曲线之中,联邦学习都是处于“创新触发期”(Innovation Trigger),效益评级均为“高”,都属于“新兴”技术,到达生产高峰期(thePlateau of Productivity)的时间都预计为 5~10 年,且市场渗透率(Market Penetration)都低于 1%。
结论
中国已经成为联邦学习技术的深度参与方,国内企业和科研机构积极参与联邦学习的技术研发和应用,以及标准制定。未来,随着人工智能技术和应用的不断升级,联邦学习的技术研发仍将较多聚焦于数据安全与隐私保护,其应用场景还将进一步扩大和深入。
报告目录
关注“开放隐私计算”公众号
后台回复“20230830”可获取报告完整PDF!
热门文章:
好书相赠 | 《元宇宙进化逻辑——用确定性的逻辑诠释不确定的未来》